Wstęp

Swoim problemem badawczym obrałem sprawdzenie, jak model wizualizacji danych wpływa na czytelność wykresu. Postanowiłem wykorzystać do tego istniejące dane w postaci przykładowego wykresu, który znalazłem w internecie. W miarę własnych możliwości odczytałem pewną część tych danych, a następnie zaprezentowałem ją w dwóch postaciach - wykres “scatter3d” stworzony za pomocą biblioteki plot_ly oraz wykres “geom_col” stworzony za pomocą ggplot2. Oryginalny wykres, choć nie jest przykładem nadzwyczaj różniącym się od wykresu pierwszego, też został rozpatrzony.

Sposób przeprowadzenia ankietyzacji

Do każdego przytoczonego wykresu były zadane trzy pytania, jedno z których nie obowiązkowe:

Prezentacja wykresów

Wykres 1 “scatter3d”

Wykres 2 “geom_col”

Oryginalny wykres

Wyniki

Poniżej zamieszczone są grafiki uzyskanych odpowiedzi:

Analiza wyników

Zdecydowana większość osób stwierdziła, że “scatter3d” jest nie czytelny, w tym samym czasie 3 część osób stwierdziła, że w sumie z wykresu oryginalnego łatwo odczytać informacje, gdy całość stwierdziła, że “geom_col” jest najbardziej przejrzysty.

Także możemy zauważyć, że postawiona wcześniej teza, że estetyczny wykres może być czytelny się nie sprawdziła, ponieważ w dwóch przykładach z trzech (czyli większość) zależność ta jest odwrotna.

Ważne uwagi z pól do ewentualnych sugestii:

Upraszczając, możemy powiedzieć, że wykresy 3D są złe z takich powodów jak brak widoczności wszystkich danych (nakładają się kropki, wyższe słupki są “bliższe” od tych niższych, więc ich przekrywają), z którym się wiąże problem dobierania perspektywy (na pierwszym wykresie trudno odczytać dane ze względu na nierównoległe wizualnie osie Export)

Z drugiej strony wykres 2D jest dobry, bo wszystkie dane są zilustrowane w jednym poziomie co pozwala na łatwe ich porównywanie, ale też na łatwe odczytanie wartości z osi.

Podsumowanie

Na koniec, prezentacja ostatecznego wyboru na temat najbardziej czytelnego wykresu